شناسایی عمل انسان در تصاویر ویدئویی به کمک ویژگی های محلی و بسته ای از کلمات تصویری
پایان نامه
- دانشگاه تربیت معلم - سبزوار - دانشکده برق و کامپیوتر
- نویسنده ریحانه رشیدی
- استاد راهنما جواد حدادنیا
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
هدف تحقیق حاضر شناسایی اعمال انسانی در تصاویر ویدئویی است که بدین منظور از بیان محلی تصاویر ویدئویی بهره گرفته ایم. یکی از راهکارهای ارائه شده در این پایان نامه تلفیق توصیفات ظاهری و بیان های حرکتی است که نهایتاً به یک توصیف کننده مکان-زمان محلی منجر می گردد. تا کنون ویژگی های محلی گوناگونی به منظور بیان اطلاعات ظاهری ارائه شده اند. ما با به کارگیری توصیف کننده جدیدی که حاصل توصیف محلی phog بر روی نقاط حاصل از آشکارساز هریس می باشد، توانستیم از مزایای توصیف کننده های دوبعدی به خوبی بهره ببریم. علاوه بر این استفاده از آشکارساز و توصیف کننده دوبعدی دیگری با نام سیفت نیز در قالب توصیف کننده های مکان-زمان محلی جهت مقایسه و ارزیابی بهتر روش پیشنهادی به طور جداگانه بیان گردیده است. برای توصیف زمانی اعمال انسانی نیز از بیان هیستوگرامی بردارهای شار نوری استفاده نمودیم و با تلفیق این دو بیان، به یک توصیف کننده واحد دست یافتیم که هم اطلاعات مکانی و هم زمانی مربوطه را شامل می شود. در ادامه با انتقال این توصیف کننده ها به فضای بسته ای از کلمات تصویری، به هیستوگرام هایی متناظر با هر ویدئو دست می یابیم که در واقع ورودی مرحله آموزش و دسته بندی خواهند بود. نتایج ارزیابی سیستم شناسایی مذکور بر روی دو پایگاه داده معروف از اعمال انسانی ارائه گردیده است. هر یک از این پایگاه های داده تعدادی عمل مختلف را شامل می شوند که توسط چندین عامل انسانی و در شرایط متفاوت انجام گرفته اند. نتایج به دست آمده نشان دهنده برتری روش به کاربرنده ویژگی محلی harris-phog در مقایسه با روش سیفت است. همچنین در مقایسه ای که با نتایج دیگر مراجع مرتبط صورت گرفت، راهکار پیشنهادی یعنی به کارگیری توصیف کننده های مکان-زمان محلی توانست به نتایج برتر و یا قابل قیاس با برترین نتایج موجود دست یابد.
منابع مشابه
استخراج عوارض از تصاویر ماهواره ای WorldView-3با استفاده از الگوریتم آدابوست به کمک ویژگی های هار-لایک
پیشرفت و توسعهی هر جامعه در گرو در دست داشتن اطلاعات صحیح و به هنگام از محیط پیرامون خود میباشد. بسیار از اطلاعات محیط پیرامون مربوط به موقعیت عوارض مختلف میباشد. این موقعیتها میتوانند از راههای مختلفی به دست بیایند. از جملهی این راهها میتوان به استخراج دستی موقعیت این عوارض از تصاویر ماهوارهای اشاره کرد که به علت زمان و هزینهبر بودن این روش استفاده از آن چندان مفید و معقول به نظر می...
متن کاملشناسایی نوع فعالیت انسان در دنباله ای از تصاویر ویدئویی با استفاده از توصیفگر بافت پویا
تشخیص نوع فعالیت انسان در دنباله ای از تصاویر ویدئویی یک موضوع مهم و پویا در بینایی کامپیوتر می باشد. این امر به برچسب گذاری دنباله تصاویر با برچسبی از فعالیت ها اطلاق می شود و به علت کاربردهای گسترده آن توجه زیادی را به خود جلب نموده است. از جمله کاربردهای آن می توان به سیستم های نظارت هوشمند، هدایت روبات ها، اتومبیل های خودکار و اندیس گذاری ویدئو اشاره کرد. مسئله ی تشخیص نوع فعالیت انسان را م...
15 صفحه اولالگوی انتروپی محلی جهت استخراج ویژگی های تصاویر بافتی
روشهای زیادی برای استخراج ویژگی از تصاویر بافتی ارائه شده اند، یکی از مهمترین و ساده ترین روش ها، روش های مبتنی بر الگوی دودویی محلی است که بدلیل سادگی در پیاده سازی و استخراج ویژگی های مناسب با دقت طبقه بندی بالا، مورد توجه بسیاری از متخصصان قرار گرفته است. همچنین از ترکیب الگوی دودویی محلی و واریانس محلی ویژگی هایی با نتایج بهتر طبقه بندی تولید شده است. در اینجا از یک روش جدید بنام الگوی انتر...
متن کاملشناسایی رفتارهای ناهنجار در تصاویر ویدئویی با استفاده از شبکه عصبی کانولوشنی
شناسایی رفتار ناهنجار ازلحاظ اهمیت یک ضرورت در سامانههای نظارت بصری تبدیلشده است. همچنین این حوزه بهعنوان یک چالش در تحقیقات بینایی ماشین بدل شده است. گرچه تلاشهای بسیاری بهمنظور رفع این مشکل انجامشده است، اما شناسایی رفتار در یک محیط واقعی و غیرقابلکنترل فاصله معناداری تا به بلوغ رسیدن آن وجود دارد. مشکل اصلی ابهام در تفاوت خصوصیات رفتار غیر نرمال و نرمال است که تعریف آن معمولاً با توجه ...
متن کاملطراحی و پیادهسازی سامانۀ بیدرنگ آشکارسازی و شناسایی پلاک خودرو در تصاویر ویدئویی
An automatic Number Plate Recognition (ANPR) is a popular topic in the field of image processing and is considered from different aspects, since early 90s. There are many challenges in this field, including; fast moving vehicles, different viewing angles and different distances from camera, complex and unpredictable backgrounds, poor quality images, existence of multiple plates in the scene, va...
متن کاملطراحی اولین پایگاه داده کلمات دستنویس کردی برای سیستم های تشخیص تصویری کلمات
چکیده: یکی از اجزای زیربنایی سیستم های تشخیص تصویری کلمات پایگاه داده هاست. هر سیستمی که در این زمینه طراحی گردد لاجرم می بایست از یک نوع پایگاه داده ها استفاده کند. بدیهی است چون موضوع مورد مطالعه در این سیستم ها شکل نوشتاری زبان های مختلف میباشد پس برای هر زبان مشخص پایگاه داده بخصوصی لازم است. زبانی که این مقاله بر آن متمرکز شده کردی است و در این مقاله مراحل مختلف چگونگی طراحی اولین پایگاه...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
دانشگاه تربیت معلم - سبزوار - دانشکده برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023